{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "name": "stderr",
     "output_type": "stream",
     "text": [
      "e:\\python\\lib\\site-packages\\numpy\\_distributor_init.py:30: UserWarning: loaded more than 1 DLL from .libs:\n",
      "e:\\python\\lib\\site-packages\\numpy\\.libs\\libopenblas.XWYDX2IKJW2NMTWSFYNGFUWKQU3LYTCZ.gfortran-win_amd64.dll\n",
      "e:\\python\\lib\\site-packages\\numpy\\.libs\\libopenblas64__v0.3.21-gcc_10_3_0.dll\n",
      "  warnings.warn(\"loaded more than 1 DLL from .libs:\"\n"
     ]
    }
   ],
   "source": [
    "import pandas as pd \n",
    "import numpy as np\n",
    "import warnings \n",
    "warnings.filterwarnings(\"ignore\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "Job = pd.read_csv(\"../Data/ProcessData/Job.csv\")\n",
    "People = pd.read_csv(\"../Data/ProcessData/People.csv\")"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Job分类\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['售前技术支持',\n",
       " '数据安全高级经理',\n",
       " '数据安全项目经理',\n",
       " '数据挖掘工程师',\n",
       " '数据管理',\n",
       " '算法工程师',\n",
       " '数据标注员',\n",
       " '会计实习生',\n",
       " '数据分析师',\n",
       " '大数据运营实习生',\n",
       " '大数据分析实习生',\n",
       " '渠道运营总监',\n",
       " '数字化创新人才',\n",
       " '银行数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '技术服务工程师',\n",
       " '大数据分析师（BI）',\n",
       " '亚马逊数据分析师',\n",
       " '数据分析助理初级',\n",
       " 'Data Governance数据治理',\n",
       " '数据分析师',\n",
       " '电商运营助理',\n",
       " '数据分析师助理',\n",
       " '数据开发',\n",
       " '数据报表开发',\n",
       " '数据分析员',\n",
       " 'ETL开发工程师',\n",
       " '数据处理员',\n",
       " '运维部-Mysql-DBA',\n",
       " 'AI类数据标注',\n",
       " '大数据开发工程师',\n",
       " '数据产品经理',\n",
       " '数据分析师',\n",
       " '销售经理',\n",
       " '数据分析师',\n",
       " '数据开发工程师',\n",
       " 'ETL开发工程师',\n",
       " '数据开发工程师',\n",
       " 'ETL开发工程师',\n",
       " '互联网产品经理',\n",
       " '数据产品经理',\n",
       " '数据分析师',\n",
       " '大数据开发工程师',\n",
       " '数据分析师',\n",
       " '交易风控员',\n",
       " '大数据开发工程师',\n",
       " '数据分析师',\n",
       " '数据工程师',\n",
       " '自然语言处理工程师',\n",
       " '爬虫工程师',\n",
       " 'Python/django后台开发工程师',\n",
       " '团队运营管理实习生',\n",
       " '技术文章撰写实习生',\n",
       " '创新俱乐部成员',\n",
       " '解决方案',\n",
       " '产品总监',\n",
       " '数据工程师',\n",
       " '高级大数据开发工程师 Hadoop Hive',\n",
       " '数据标注工程师',\n",
       " '数据挖掘工程师',\n",
       " 'python工程师',\n",
       " '数据实施实习生',\n",
       " '数据分析师',\n",
       " '数据分析员',\n",
       " '产业链数字专员',\n",
       " '数据工程师',\n",
       " '数据工程师',\n",
       " '大数据架构师',\n",
       " '大数据系统分析师',\n",
       " '大数据工程师',\n",
       " '数据分析经理',\n",
       " '数据分析员',\n",
       " '大数据开发实习生',\n",
       " '数仓开发',\n",
       " '实施工程师',\n",
       " '高级业务架构师',\n",
       " '数据开发工程师',\n",
       " '遗留数据分析专员',\n",
       " '前端工程师',\n",
       " 'Python爬虫工程师',\n",
       " '数据分析师',\n",
       " '技术后端',\n",
       " '数据实施工程师',\n",
       " '数据分析助理',\n",
       " '数据运营',\n",
       " '大数据分析师',\n",
       " '数据处理工程师',\n",
       " 'NLP算法研究员',\n",
       " '商品数据分析专员',\n",
       " '数据分析师',\n",
       " '数据工程师',\n",
       " '区域督导',\n",
       " '数据处理实习生',\n",
       " '数据分析实习生',\n",
       " '地图数据加工处理专员',\n",
       " 'AI数据标注师',\n",
       " '数据分析初级',\n",
       " 'BI数据分析师助理',\n",
       " '数据治理工程师',\n",
       " '电网数据分析实习生 ',\n",
       " '电商数据分析师',\n",
       " '计算机大数据推广专员',\n",
       " '视频数据标注',\n",
       " '在线客服',\n",
       " '电商数据分析师',\n",
       " '电商客服',\n",
       " '机器学习算法研发工程师（嵌入式软件）',\n",
       " '大数据开发工程师',\n",
       " '成本预算工程师',\n",
       " '集团总部-高级数据分析师',\n",
       " '电商数据分析',\n",
       " '数字化工程师',\n",
       " '电商战略分析师',\n",
       " '商业数据分析师',\n",
       " '工程师助理',\n",
       " '数据分析员',\n",
       " '数据运营专员',\n",
       " '数据分析师',\n",
       " '语音前端算法研发工程师  ',\n",
       " '数据分析师',\n",
       " '产品专员',\n",
       " '数据分析助理工程师',\n",
       " '遗留判定分析工程师',\n",
       " '研发文员',\n",
       " '嵌入式软件实习生',\n",
       " '数据分析师',\n",
       " '测试工程师',\n",
       " 'JAVA工程师',\n",
       " '数据分析师',\n",
       " '平面设计师',\n",
       " '内训师',\n",
       " '数据分析',\n",
       " '技术支持',\n",
       " '质检工程师',\n",
       " '物流招商经理',\n",
       " '运维工程师（大数据）',\n",
       " '数据分析师',\n",
       " '在线客服',\n",
       " '选品员',\n",
       " 'web前端开发工程师',\n",
       " '商务拓展（BD）总监',\n",
       " '中国移动10086客户服务代表\\n',\n",
       " '电商数据分析',\n",
       " '高级数据分析师（成人教育方向）',\n",
       " 'pmo项目经理',\n",
       " 'HRIS',\n",
       " 'bi数据分析师',\n",
       " '桥梁工程师',\n",
       " '助理检测师',\n",
       " '桥梁健康监测数据分析师',\n",
       " '技术管理岗',\n",
       " '商业分析师/数据分析师',\n",
       " 'BI工程师',\n",
       " '大数据架构师',\n",
       " '国际物流客服专员',\n",
       " '数据分析师',\n",
       " '试验检测工程（员）师',\n",
       " '水利大数据分析师',\n",
       " '数据分析师',\n",
       " '数据库管理员',\n",
       " '运维工程师',\n",
       " '测试工程师',\n",
       " ' JAVA开发工程师',\n",
       " '前端开发工程师',\n",
       " '实施顾问',\n",
       " ' 技术支持',\n",
       " '数据分析',\n",
       " 'JAVA工程师',\n",
       " '管理培训生（数据标注方向）',\n",
       " '管理培训生（软件研发方向）',\n",
       " '管理培训生（技术支持方向）',\n",
       " '管理培训生（销售方向）',\n",
       " '数据分析师',\n",
       " '销售助理/销售代表 ',\n",
       " '.NET开发工程师',\n",
       " '数据分析师',\n",
       " '人力资源经理',\n",
       " '会计',\n",
       " 'BI数据分析师',\n",
       " '游戏研发工程师',\n",
       " '软件开发工程师',\n",
       " '大数据开发工程师',\n",
       " '工业大数据工程师',\n",
       " '天猫运营',\n",
       " '运营助理',\n",
       " '产品实施工程师',\n",
       " '大数据工程师',\n",
       " 'IT运维经理',\n",
       " '实施顾问',\n",
       " ' 技术支持',\n",
       " '实施工程师 ',\n",
       " 'NET开发（实习生/应届生）',\n",
       " '影视动画设计师',\n",
       " 'java开发岗',\n",
       " '数据标注工程师',\n",
       " 'Java软件开发工程师',\n",
       " '前端工程师 ',\n",
       " '前端开发工程师（实习生） ',\n",
       " '资深游戏数据分析师',\n",
       " '游戏服务端开发',\n",
       " '游戏策划实习生',\n",
       " '游戏测试',\n",
       " '数据分析师',\n",
       " '测试工程师',\n",
       " '运维工程师',\n",
       " '产品专员',\n",
       " '电商数据分析',\n",
       " '技术支持',\n",
       " '电商数据分析',\n",
       " '游戏客服专员',\n",
       " '技术支持',\n",
       " '软件开发工程师',\n",
       " '图像算法工程师',\n",
       " '销售代表',\n",
       " '售后和实施工程师',\n",
       " 'JAVA开发工程师',\n",
       " '大数据开发工程师',\n",
       " 'Java高级开发工程师',\n",
       " 'Java高级开发工程师',\n",
       " '项目负责人',\n",
       " 'Java初级开发工程师',\n",
       " 'JAVA工程师',\n",
       " 'php工程师',\n",
       " '大数据架构师',\n",
       " '数据支持工程师',\n",
       " '临床研究数据分析员',\n",
       " '电商数据分析',\n",
       " '量化实习生',\n",
       " '前端工程师',\n",
       " 'Web前端开发工程师',\n",
       " '软件测试工程师',\n",
       " '软件技术支持 ',\n",
       " '硬件工程师',\n",
       " '电源工程师',\n",
       " 'PCB工程师',\n",
       " '硬件测试工程师',\n",
       " '渠道销售',\n",
       " '开发-广州银行项目',\n",
       " '数据开发-广州银行项目',\n",
       " '数据开发岗-广州银行项目',\n",
       " '数据开发岗-广州银行项目',\n",
       " '数据开发岗-广州银行项目',\n",
       " '测试(初级)-广州银行项目',\n",
       " '应用环境支持-广州银行项目',\n",
       " '测试(中级)-广州银行项目',\n",
       " '测试(中级)-广州银行项目',\n",
       " '测试(中级)-广州银行项目',\n",
       " '测试(初级)-广州银行项目',\n",
       " '测试岗-广州银行项目',\n",
       " '测试岗-广州银行项目',\n",
       " '项目助理岗-广州银行项目',\n",
       " '测试(高级)-广州银行项目',\n",
       " '测试岗-广州银行项目',\n",
       " '需求分析岗-广州银行项目',\n",
       " '开发-广州银行项目',\n",
       " '开发、数据开发-广州银行项目',\n",
       " '开发-广州银行项目',\n",
       " '数据开发岗-广州银行项目',\n",
       " '硬件技术支持',\n",
       " 'Android应用开发工程师',\n",
       " 'C/C++软件开发工程师',\n",
       " '渠道拓客专员/实习生',\n",
       " '技术支持',\n",
       " '产品运营实习生',\n",
       " '测试(高级)-广州银行项目',\n",
       " '测试(中级)-广州银行项目',\n",
       " '开发-广州银行项目',\n",
       " '开发-广州银行项目',\n",
       " '开发-广州银行项目',\n",
       " '算法工程师',\n",
       " '数据工程师',\n",
       " '呼叫专员/实习生',\n",
       " '新媒体运营（线上商机）专员/实习生',\n",
       " '大客户销售',\n",
       " '结构设计师',\n",
       " '测试(中级)-广州银行项目',\n",
       " '测试(中级)-广州银行项目',\n",
       " '测试(中级)-广州银行项目',\n",
       " '测试(中级)-广州银行项目',\n",
       " '嵌入式软件开发工程师（Linux方向）',\n",
       " 'Web后台开发工程师',\n",
       " '开发-广州银行项目',\n",
       " '开发-广州银行项目',\n",
       " '大数据开发工程师',\n",
       " '外贸销售',\n",
       " '售后工程师',\n",
       " '销售工程师',\n",
       " '伺服研发工程师',\n",
       " '嵌入式软件工程师',\n",
       " '算法工程师',\n",
       " '电商数据分析师',\n",
       " '电商客服专员',\n",
       " '数据实施顾问',\n",
       " '客户专员（管培生）',\n",
       " '驻场oppo-测试工程师',\n",
       " '射频工程师',\n",
       " '人力资源经理',\n",
       " '咨询经理',\n",
       " '数据标注员',\n",
       " '实施工程师',\n",
       " 'JAVA开发工程师',\n",
       " '软件测试工程师',\n",
       " 'JAVA开发',\n",
       " '数据实习生',\n",
       " 'Java开发工程师（广州/重庆/福州都有招聘）',\n",
       " '数据库管理员（广州）',\n",
       " '网络工程师/系统工程师（广州）',\n",
       " '百度数据标注员',\n",
       " '大数据开发工程师-运通信息',\n",
       " '大数据开发工程师',\n",
       " '数据库开发工程师',\n",
       " '前端开发工程师',\n",
       " 'Java开发工程师',\n",
       " '电商客服',\n",
       " '银行账单分期专员',\n",
       " '管培生',\n",
       " '2022校招-优粤生',\n",
       " '高级数据分析师/主管',\n",
       " '数据分析师',\n",
       " '高级数据分析师/主管',\n",
       " '数据分析师',\n",
       " '产品经理',\n",
       " '大数据产品经理',\n",
       " '高级产品经理',\n",
       " 'etl开发工程师',\n",
       " '终端销售代表',\n",
       " '实习生',\n",
       " '数据服务部工程师',\n",
       " '产品经理',\n",
       " '数据产品技术经理',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（广州）',\n",
       " '数据产品经理',\n",
       " 'Planning Analyst 数据分析员',\n",
       " '阿里灵犀互娱-游戏数据分析师-广州',\n",
       " '阿里灵犀互娱-游戏数据分析师-广州',\n",
       " '大文娱互动娱乐事业部-高级数据产品经理-买量平台',\n",
       " '高级数据分析师（经理级）',\n",
       " '高级数据分析师',\n",
       " '（资深/高级）数据分析师',\n",
       " '高德地图数据编辑',\n",
       " '客服顾问',\n",
       " '比价审核岗',\n",
       " '直播审核岗',\n",
       " '视频审核岗',\n",
       " '客服专员',\n",
       " 'AI平台研发工程师（实习）',\n",
       " 'AI算法工程师（实习）',\n",
       " '知识专员',\n",
       " '服务解决方案工程师',\n",
       " '合同专员',\n",
       " '创意设计',\n",
       " '互联网运营',\n",
       " '终端培训师',\n",
       " '服务技术顾问',\n",
       " '服务体验顾问',\n",
       " '软件测试开发工程师',\n",
       " '游戏测试工程师',\n",
       " '初级安服工程师',\n",
       " '视觉应用工程师',\n",
       " '新零售管培生',\n",
       " '交互与视觉设计',\n",
       " 'ETL数据库开发工程师',\n",
       " 'NLP算法工程师',\n",
       " '人力资源数据分析师',\n",
       " '人力资源数据分析师',\n",
       " '(高级）数据分析师',\n",
       " '（高级）数据分析师-顾客体验及数字化业务',\n",
       " '校招岗位',\n",
       " '线上服务顾问',\n",
       " '体验店顾问',\n",
       " '测试工程师',\n",
       " '高级数据分析师（经理级）',\n",
       " '高级数据分析师',\n",
       " '（资深/高级）数据分析师',\n",
       " 'Data Analyst',\n",
       " '(高级）数据分析师',\n",
       " '（高级）数据分析师-顾客体验及数字化业务',\n",
       " '（高级）数据分析师-顾客体验及数字化业务',\n",
       " '算法工程师 - 自然语言处理',\n",
       " '产品经理',\n",
       " '数据产品技术经理',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（广州）',\n",
       " '人力资源数据分析师',\n",
       " '人力资源数据分析师',\n",
       " '高级数据分析师/主管',\n",
       " '数据分析师',\n",
       " '产品经理',\n",
       " '大数据产品经理',\n",
       " '高级产品经理',\n",
       " 'etl开发工程师',\n",
       " 'ETL数据库开发工程师',\n",
       " 'NLP算法工程师',\n",
       " '产品经理',\n",
       " '资深游戏数据分析师',\n",
       " '资深游戏数据分析师',\n",
       " '游戏数据研究员',\n",
       " '商业化数据产品经理',\n",
       " '数据产品经理（稻壳）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '产品经理',\n",
       " '医学统计/数据管理专员',\n",
       " 'BA Data analyst 数据分析师',\n",
       " 'BA Data analyst 数据分析师',\n",
       " '国际化广告数据分析师',\n",
       " '数据分析师 - 国际化直播',\n",
       " '数据分析师',\n",
       " '资深游戏数据分析师',\n",
       " '国际化广告数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（广州）',\n",
       " '数据分析师（广州）',\n",
       " '产品经理',\n",
       " '产品经理',\n",
       " '高级产品经理',\n",
       " '大数据产品经理',\n",
       " '运营数据产品经理',\n",
       " '数据分析师（数据开发方向）',\n",
       " '数据分析师（数据开发方向）',\n",
       " '数据分析师',\n",
       " '高级数据分析师/主管',\n",
       " '产品行销经理',\n",
       " '测试经理（数据库产品）',\n",
       " '数据产品技术经理',\n",
       " '数据分析师',\n",
       " '数据分析师 - 国际化直播',\n",
       " '数据分析师',\n",
       " '数据治理工程师-广州',\n",
       " '中级数据分析师-广州',\n",
       " '中级数据分析师-广州',\n",
       " '产品经理（支付/后端）',\n",
       " '数据分析师/高级数据分析师(J13098)',\n",
       " '数据分析师/高级数据分析师(J13098)',\n",
       " '资深数据分析师',\n",
       " '数据分析员',\n",
       " '制药行业主数据产品经理',\n",
       " '零售行业主数据产品经理(J10281)',\n",
       " '数据分析师/BI',\n",
       " '高级数据产品经理',\n",
       " 'TiDB数据库高级产品经理',\n",
       " '数据库内核产品经理',\n",
       " '高级数据分析师',\n",
       " '资深数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师-GZ',\n",
       " '数据分析师-GZ',\n",
       " '数据产品运营经理-GZ',\n",
       " '高级数据产品经理',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '高级客户经理（气象大数据产品）',\n",
       " '产品经理（气象大数据产品）',\n",
       " '数据分析运营专员',\n",
       " '数据分析师（发展前景+双休）',\n",
       " '数据分析师（发展前景+双休）',\n",
       " '产品经理',\n",
       " '数据产品技术经理',\n",
       " '自然语言处理/NLP工程师（2019校园招聘）',\n",
       " '自然语言处理/NLP工程师',\n",
       " 'ETL/BI/数据库开发工程师',\n",
       " '数据治理/数据中台产品经理',\n",
       " '数据产品经理（商业化方向）',\n",
       " '高级媒介专员（数据分析方向）',\n",
       " '数据产品经理',\n",
       " '大数据产品经理',\n",
       " '数据产品经理',\n",
       " '资深数据分析师',\n",
       " '资深数据分析师',\n",
       " '资深数据分析师',\n",
       " '资深数据分析师',\n",
       " '项目交付工程师（数据治理）',\n",
       " '科学家/研究员/工程师（NLP）-创新工场AI工程院',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师（商品方向）',\n",
       " '数据分析师',\n",
       " '数据产品经理',\n",
       " '数据产品经理/高级经理',\n",
       " '数据中台产品经理',\n",
       " '数据分析师',\n",
       " 'ETL开发工程师',\n",
       " '数据分析师',\n",
       " 'Data Analyst/Business Analyst',\n",
       " '数据分析师',\n",
       " 'Data Analyst',\n",
       " '数据分析师',\n",
       " '数据分析专员',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师-广州',\n",
       " '数据分析师-广州',\n",
       " 'ETL开发工程师',\n",
       " 'NLP算法专家/工程师',\n",
       " '数据分析师',\n",
       " '数据分析师(J10380)',\n",
       " '数据分析师（独立站）',\n",
       " '数据分析师',\n",
       " '数据分析师(J10380)',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析工程师（NLP方向）(J11892)',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '贝壳找房-广州站-数据分析专员',\n",
       " '贝壳找房-广州站-交易数据分析专员',\n",
       " '数据分析师（商品方向）',\n",
       " '数据分析师',\n",
       " 'ETL开发工程师',\n",
       " '数据分析师',\n",
       " '大数据产品经理（智能网联合资公司）',\n",
       " '大数据产品经理（数字营销方向）',\n",
       " '大数据算法产品经理',\n",
       " '高级数据产品经理',\n",
       " '业务数据分析师',\n",
       " '业务数据分析师',\n",
       " '数据分析专员',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '大数据产品经理（智能网联合资公司）',\n",
       " '大数据产品经理（数字营销方向）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师-广州',\n",
       " '数据分析师-广州',\n",
       " 'ETL开发工程师',\n",
       " 'NLP算法专家/工程师',\n",
       " '大数据算法产品经理',\n",
       " '高级数据产品经理',\n",
       " '数据分析师',\n",
       " '数据分析师(J10380)',\n",
       " '数据分析师（独立站）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析工程师（NLP方向）(J11892)',\n",
       " '业务数据分析师',\n",
       " '业务数据分析师',\n",
       " '财务数据分析师',\n",
       " '财务数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析专员',\n",
       " '数据产品经理',\n",
       " '自然语言处理工程师',\n",
       " '数据产品经理',\n",
       " '产品经理（数据方向）',\n",
       " '高级数据产品经理',\n",
       " '数据产品经理',\n",
       " '数据分析员',\n",
       " '数据中台产品经理',\n",
       " '大数据应用产品经理',\n",
       " '大数据应用产品经理（中高级）',\n",
       " '大数据高级产品经理',\n",
       " '数据产品经理',\n",
       " '大数据产品经理',\n",
       " '大数据产品经理/总监',\n",
       " '大数据产品经理 校招',\n",
       " '数据分析师',\n",
       " '数据分析师(J10380)',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析专员',\n",
       " 'ETL开发工程师 (MJ001915)',\n",
       " '数据产品经理（可视化工具）',\n",
       " '数据产品经理（初中级）',\n",
       " '数据分析师（广州）',\n",
       " '数据分析师 (MJ001550)',\n",
       " '数据分析师（广州）',\n",
       " '数据分析师 (MJ001550)',\n",
       " '数据产品经理 (MJ000031)',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '大数据产品经理',\n",
       " '电商产品数据分析(J10169)',\n",
       " '产品经理（家具）(J10169)',\n",
       " '爆品产品经理(J10169)',\n",
       " '电商产品经理(J10169)',\n",
       " '财务数据产品经理（BI）(J11008)',\n",
       " '大数据产品经理',\n",
       " 'PM产品经理（数据中台）',\n",
       " '数据分析师（数据BP)',\n",
       " '数据分析师（数据BP)',\n",
       " '数据产品经理',\n",
       " '数据治理工程师',\n",
       " '大数据产品经理',\n",
       " '生物信息工程师/临床数据分析师',\n",
       " '生物信息工程师/临床数据分析师',\n",
       " '数据产品经理',\n",
       " '数据分析专员（2022届校招）',\n",
       " '数据治理项目高级开发工程师',\n",
       " '大数据平台产品经理',\n",
       " '数据产品经理',\n",
       " '算法工程师（推荐/NLP/机器学习）',\n",
       " '数据产品经理(J10954)',\n",
       " 'ETL开发工程师',\n",
       " '数据治理工程师',\n",
       " 'nlp高级算法工程师',\n",
       " '商品数据分析专员',\n",
       " '数据分析专员',\n",
       " '高级数据分析专员（游戏广告）',\n",
       " '计算机视觉研发工程师',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据专员（天猫电商数据分析）',\n",
       " '项目数据分析师',\n",
       " '数据分析师（商业地产及零售行业）',\n",
       " '项目数据分析师',\n",
       " '商管系统产品经理',\n",
       " '行业门户APP产品经理',\n",
       " '产品经理',\n",
       " '选址SAAS产品经理',\n",
       " '行业门户APP产品经理',\n",
       " '广州产品经理',\n",
       " '产品经理（大数据后台）',\n",
       " '大数据后台产品经理',\n",
       " '数据产品经理',\n",
       " '数据分析师 (MJ002723)',\n",
       " '数据分析师 (MJ002723)',\n",
       " '数据分析师 (MJ002723)',\n",
       " 'nlp算法工程师',\n",
       " '商品数据分析专员',\n",
       " '数据分析师（Fine BI/Report）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据治理工程师',\n",
       " '战客部数据分析岗',\n",
       " '车联网大数据运用',\n",
       " '车联网大数据运用',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '高级数据分析师',\n",
       " '产品经理（大数据应用）',\n",
       " '产品经理（大数据项目）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '商品企划经理',\n",
       " '数据分析专员',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（Fine BI/Report）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据平台产品（专业）经理',\n",
       " '数据产品经理',\n",
       " '数据分析师（数据挖掘方向）',\n",
       " '数据分析师（商业地产及零售行业）',\n",
       " '选址SAAS产品经理',\n",
       " '资深数据产品经理',\n",
       " '数据产品经理',\n",
       " '数据分析师（Fine BI/Report）',\n",
       " '数据采集分析员',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（数据挖掘方向）',\n",
       " '数据分析师',\n",
       " '计算机视觉工程师',\n",
       " '计算机视觉工程师',\n",
       " 'BI Engineer/ Data Analyst',\n",
       " '客服中心运营专员（数据分析）',\n",
       " '数据分析专员-广州【2022届校招】',\n",
       " 'NLP算法工程师',\n",
       " 'etl开发工程师',\n",
       " '数据分析专员',\n",
       " 'ETL开发工程师',\n",
       " '计算机视觉语义理解算法工程师',\n",
       " '高级数据分析师',\n",
       " 'nlp算法工程师',\n",
       " '自然语言处理工程师',\n",
       " 'ETL开发工程师',\n",
       " '运营助理',\n",
       " '数据分析专员',\n",
       " '高级数据分析师',\n",
       " '数据分析师（投放向） (MJ000326)',\n",
       " '高级数据分析师',\n",
       " '数据分析师（投放向） (MJ000326)',\n",
       " '数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '自然语言处理工程师（NLP）',\n",
       " '数据分析师（服装品类）',\n",
       " '数据分析师（22届校招）',\n",
       " '数据分析师（22届校招）',\n",
       " '数据分析专员',\n",
       " '大数据分析员',\n",
       " '数据分析师（运营支持）',\n",
       " '数据分析师（运营支持）',\n",
       " '数据分析专员',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据产品经理',\n",
       " 'NLP算法工程师',\n",
       " '销售数据分析师',\n",
       " '销售数据分析师',\n",
       " '销售数据分析师',\n",
       " '数据产品经理',\n",
       " '屈臣氏渠道专员（数据统计分析方向+近地铁）',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " 'NLP算法工程师 (MJ003321)',\n",
       " 'NLP高级工程师',\n",
       " '数据分析师 (MJ003742)',\n",
       " '数据分析师（电商） (MJ004080)',\n",
       " '数据分析师（国际化） (MJ003534)',\n",
       " '数据分析师 (MJ003570)',\n",
       " '数据分析师 (MJ003742)',\n",
       " '数据分析师（电商） (MJ004080)',\n",
       " '跨境电商数据分析专员',\n",
       " '产品经理（数据类）',\n",
       " '产品经理（数据类）',\n",
       " '产品经理（大数据方向）',\n",
       " '计算机视觉算法工程师（深度...',\n",
       " '计算机视觉算法工程师 (MJ000510)',\n",
       " '计算机视觉算法高级工程师-AI审核方向',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（国际化） (MJ003534)',\n",
       " '数据分析师 (MJ003570)',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '产品经理',\n",
       " '算法工程师',\n",
       " '数据平台产品经理',\n",
       " '数据平台产品经理 (MJ004500)',\n",
       " '数据产品经理/专家',\n",
       " '数据产品经理 (MJ003187)',\n",
       " '数据产品经理（电商） (MJ004437)',\n",
       " '数据安全产品经理 (MJ004420)',\n",
       " '数据产品经理 (MJ000702)',\n",
       " '计算机视觉算法工程师 (MJ004259)',\n",
       " '数据分析师（服装品类）',\n",
       " '医学数据分析师',\n",
       " '医学数据分析师',\n",
       " 'BA商业分析师/数据分析师',\n",
       " 'BA商业分析师/数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '高级nlp算法工程师',\n",
       " '（中高级）数据分析师',\n",
       " '（中高级）数据分析师',\n",
       " '大数据产品经理（高级）',\n",
       " '电力工程师/技术员',\n",
       " '数据产品经理',\n",
       " '数据产品经理',\n",
       " '计算机视觉算法工程师 (MJ001970)',\n",
       " '电商运营',\n",
       " '数据分析师',\n",
       " '大数据产品销售经理',\n",
       " '天猫助理',\n",
       " '电商助理',\n",
       " '环保数据分析员',\n",
       " '数据产品经理',\n",
       " '图像&NLP 算法工程师(J10323)',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据产品经理',\n",
       " 'NLP算法工程师 (MJ000080)',\n",
       " '产品经理',\n",
       " '数据分析专员',\n",
       " '高级产品经理（大数据平台）',\n",
       " '亚马逊产品开发（数据分析员）（美妆个护时尚方向）',\n",
       " '数据产品经理(J12754)',\n",
       " '大数据开发工程师（数据治理）',\n",
       " 'java开发工程师（数据治理）',\n",
       " '大数据产品经理-公安行业',\n",
       " 'nlp算法工程师',\n",
       " 'BI工程师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据产品经理(J34YP)',\n",
       " '数据产品经理',\n",
       " '资深数据分析师',\n",
       " '高级数据分析师',\n",
       " '资深数据分析师',\n",
       " '大数据产品销售经理',\n",
       " 'BI数据分析师',\n",
       " '数据分析师/数据研究员',\n",
       " '数据分析师/数据研究员',\n",
       " '数据分析师(J10790)',\n",
       " '数据分析师(J10790)',\n",
       " 'NLP算法工程师',\n",
       " 'nlp算法工程师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据产品经理',\n",
       " '数据分析专员',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '行业调研数据分析师（广州-校招）ID94080',\n",
       " '行业调研数据分析师（广州-校招）ID94080',\n",
       " '数据分析师(编号D1#0723）',\n",
       " '数据分析师(编号D1#0723）',\n",
       " '计算机视觉算法研究工程师',\n",
       " '计算机视觉算法研究工程师',\n",
       " '电商数据分析专员',\n",
       " '数据分析师',\n",
       " '数据分析师（接受优秀应届生）',\n",
       " '数据分析师（接受优秀应届生）',\n",
       " '金融数据采编/数据产品经理',\n",
       " '资深NLP算法工程师',\n",
       " 'NLP算法工程师',\n",
       " '数据分析专员',\n",
       " '数据产品经理',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " 'NLP算法工程师（接受优秀应届毕业生）',\n",
       " 'nlp算法工程师',\n",
       " '高级数据分析师',\n",
       " '自然语言处理算法工程师',\n",
       " '数据产品经理',\n",
       " '电商数据产品经理',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师-[465681]',\n",
       " '数据分析师',\n",
       " '数据产品经理 / BI实施顾问 (职位编号：CP10)',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师-[465681]',\n",
       " 'NLP算法工程师(J10631)',\n",
       " 'NLP算法工程师(J10631)',\n",
       " '高级数据分析师(业务分析)(J10275)',\n",
       " '数据分析师（海外）(J10744)',\n",
       " '高级数据分析师(业务分析)(J10275)',\n",
       " '数据分析师（海外）(J10744)',\n",
       " '数据产品经理',\n",
       " '数据产品经理',\n",
       " '大数据产品经理',\n",
       " 'BIGO_图像处理和深度学习工程师（资深）（北京/广州/上海/新加坡） (MJ003262)',\n",
       " '图形图像算法工程师（广州/北京）',\n",
       " '计算机视觉算法工程师',\n",
       " '数据部产品经理',\n",
       " '大数据产品经理/主管',\n",
       " '互联网/大数据产品经理',\n",
       " '数据分析师（业务分析）+周末双休+朝九晚六',\n",
       " '数据分析师（业务分析）+周末双休+朝九晚六',\n",
       " '数据分析师（业务分析）+周末双休+朝九晚六',\n",
       " '高级运营数据分析师',\n",
       " '高级运营数据分析师',\n",
       " '银行数据分析师',\n",
       " '银行数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '宝洁项目运营数据分析专员',\n",
       " '数据分析员',\n",
       " '数据分析专员',\n",
       " '数据分析专员',\n",
       " 'nlp算法工程师',\n",
       " '算法工程师（NLP方向）',\n",
       " '算法工程师（NLP方向）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '产品经理',\n",
       " '数据产品经理',\n",
       " '数据分析专员',\n",
       " '数据分析专员',\n",
       " '自然语言处理工程师（NLP）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '爬虫工程师',\n",
       " '爬虫工程师',\n",
       " '产品经理',\n",
       " '高级python爬虫工程师',\n",
       " '大数据产品经理',\n",
       " '运营数据产品经理',\n",
       " '临床数据分析专员',\n",
       " '数据分析师',\n",
       " '高级数据产品经理',\n",
       " '数据产品经理',\n",
       " '医学顾问（消化内科方向）',\n",
       " '医学专员',\n",
       " '商务/数据分析师',\n",
       " '数据产品经理',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师(业务方向)',\n",
       " '数据分析师（电商平台）',\n",
       " '数据分析师(业务方向)',\n",
       " '数据分析师（电商平台）',\n",
       " '数据挖掘工程师（自然语言处理）',\n",
       " 'nlp算法工程师',\n",
       " 'NLP算法工程师（专家）',\n",
       " '资深NLP算法工程师',\n",
       " '数据分析专员',\n",
       " '数据分析专员（新零售事业部）',\n",
       " '商品数据分析专员',\n",
       " '自然语言处理工程师（NLP）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据产品经理',\n",
       " '数据产品经理',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '生物信息数据分析员',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " 'NLP算法工程师',\n",
       " '爬虫架构师',\n",
       " '数据分析师',\n",
       " '产品经理（医疗大数据）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '产品经理（数据类）',\n",
       " '数据平台产品经理',\n",
       " '数据应用产品经理',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（需驻场南沙）',\n",
       " '项目经理（数据类产品）',\n",
       " '产品经理（数据产品）',\n",
       " '数据产品经理',\n",
       " '数据产品经理（渠道/经销商）',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " '产品经理',\n",
       " '产品经理',\n",
       " '数据分析师（电商护肤品+CBD猎德地铁站）',\n",
       " '高级数据分析师/数据分析经理',\n",
       " '数据分析师（电商护肤品+CBD猎德地铁站）',\n",
       " '高级数据分析师/数据分析经理',\n",
       " '人力数据分析师',\n",
       " '高级数据分析师',\n",
       " '临床数据分析专员',\n",
       " '数据分析师',\n",
       " '生物信息数据分析员',\n",
       " '数据分析师',\n",
       " '产品经理（医疗大数据）',\n",
       " '数据分析师',\n",
       " '数据分析师',\n",
       " '产品经理（数据类）',\n",
       " '数据治理工程师（跨境电商）',\n",
       " '数据分析师',\n",
       " '数据分析师 (MJ000889)',\n",
       " '数据分析师',\n",
       " '数据分析师 (MJ000889)',\n",
       " '数据产品经理',\n",
       " '数据产品经理',\n",
       " '数据产品高级经理',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（需驻场南沙）',\n",
       " '高级数据分析师',\n",
       " '数据分析师',\n",
       " '数据分析师（需驻场南沙）',\n",
       " '项目经理（数据类产品）',\n",
       " '产品经理（数据产品）',\n",
       " '高级数据分析师',\n",
       " '高级数据分析师',\n",
       " '数据分析专员',\n",
       " '产品经理',\n",
       " '产品经理',\n",
       " '产品经理',\n",
       " '数据分析师（电商护肤品+CBD猎德地铁站）',\n",
       " '高级数据分析师/数据分析经理',\n",
       " ...]"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "job_name_list = Job['positionName'].values.tolist()\n",
    "job_name_list"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "['直播运营实习生',\n",
       " 'RPA实施工程师',\n",
       " '结构设计师',\n",
       " '高级生信分析工程师',\n",
       " '知识专员',\n",
       " '售前技术支持',\n",
       " '项目助理岗-广州银行项目',\n",
       " '技术管理岗',\n",
       " '技术服务工程师',\n",
       " '在线客服',\n",
       " '商务拓展（BD）总监',\n",
       " 'CRM主管',\n",
       " '线上服务顾问',\n",
       " '销售专员',\n",
       " '产业链数字专员',\n",
       " '渠道运营总监',\n",
       " '产品总监',\n",
       " '企业培训售前咨询',\n",
       " '电商运营',\n",
       " 'HRIS',\n",
       " '数字化工程师',\n",
       " '项目管理',\n",
       " '2022校园招聘-市场营运类',\n",
       " '测试(高级)-广州银行项目',\n",
       " '医学顾问（消化内科方向）',\n",
       " '会计',\n",
       " '服务解决方案工程师',\n",
       " '主播',\n",
       " '应用环境支持-广州银行项目',\n",
       " '测试工程师',\n",
       " '实习生',\n",
       " '质检工程师',\n",
       " '服务技术顾问',\n",
       " '销售工程师',\n",
       " '实施顾问',\n",
       " '创意设计',\n",
       " '区域督导',\n",
       " '研发文员',\n",
       " '售后工程师',\n",
       " '产品运营实习生',\n",
       " '管理培训生（软件研发方向）',\n",
       " '需求分析岗-广州银行项目',\n",
       " '抖音/快手/视频号主播',\n",
       " '计费支撑工程师（外包岗）',\n",
       " '教学助理',\n",
       " '客服顾问',\n",
       " '团队运营管理实习生',\n",
       " '遗留判定分析工程师',\n",
       " '渠道拓客专员/实习生',\n",
       " '电商客服',\n",
       " '驻场oppo-测试工程师',\n",
       " '值班监控工程师（外包岗）',\n",
       " '量化实习生',\n",
       " '管培生',\n",
       " '实习生岗位',\n",
       " '运营助理',\n",
       " '网络工程师/系统工程师（广州）',\n",
       " '运维工程师（深圳 长沙）',\n",
       " '产品实施工程师',\n",
       " '销售专员1',\n",
       " '外贸销售',\n",
       " '需求分析师',\n",
       " '天猫助理',\n",
       " '运维工程师',\n",
       " '游戏测试',\n",
       " '企业合作专员',\n",
       " '销售助理',\n",
       " '产品助理',\n",
       " '产品助理(SX)',\n",
       " '嵌入式软件工程师',\n",
       " '销售代表',\n",
       " '电源工程师',\n",
       " '游戏研发工程师',\n",
       " '新零售管培生',\n",
       " '选品员',\n",
       " '电商运营助理',\n",
       " '互联网运营',\n",
       " '测试(初级)-广州银行项目',\n",
       " '游戏客服专员',\n",
       " '终端销售代表',\n",
       " '电商助理',\n",
       " '电商客服专员',\n",
       " '视频审核岗',\n",
       " '院校咨询招生',\n",
       " '账务支撑工程师（外包岗）',\n",
       " '软件测试工程师',\n",
       " '运维工程师（北京 上海 深圳 长沙）',\n",
       " '大客户销售',\n",
       " '游戏用户营销（GS）专员-岗位JD',\n",
       " '技术文章撰写实习生',\n",
       " '运维部-Mysql-DBA',\n",
       " '工程师助理',\n",
       " '硬件测试工程师',\n",
       " '体验顾问',\n",
       " '分析工程师',\n",
       " '中国移动10086客户服务代表\\n',\n",
       " '项目负责人',\n",
       " '银行账单分期专员',\n",
       " '助理检测师',\n",
       " '客服专员',\n",
       " '营业支撑工程师（外包岗）',\n",
       " '管理培训生（销售方向）',\n",
       " '平面设计师',\n",
       " '测试岗-广州银行项目',\n",
       " '游戏策划实习生',\n",
       " '测试(中级)-广州银行项目',\n",
       " '游戏GS',\n",
       " '成本预算工程师',\n",
       " '广州银行账单分期+六险一金+高温补贴',\n",
       " '合同专员',\n",
       " '新媒体运营（线上商机）专员/实习生',\n",
       " '软件测试',\n",
       " '嵌入式软件实习生',\n",
       " '射频工程师',\n",
       " '院校合作专员',\n",
       " '产品专员',\n",
       " '2022校招-优粤生',\n",
       " '电力工程师/技术员',\n",
       " '销售助理/销售代表 ',\n",
       " '售后和实施工程师',\n",
       " '运营专员',\n",
       " ' 技术支持',\n",
       " '硬件技术支持',\n",
       " '比价审核岗',\n",
       " 'PCB工程师',\n",
       " '人事专员',\n",
       " '试验检测工程（员）师',\n",
       " '软件技术支持 ',\n",
       " '新媒体运营助理',\n",
       " '运维工程师（长沙 深圳）',\n",
       " '游戏客服专员-岗位JD',\n",
       " '硬件工程师',\n",
       " '初级安服工程师',\n",
       " '实施工程师',\n",
       " '国际物流客服专员',\n",
       " '呼叫专员/实习生',\n",
       " '创新俱乐部成员',\n",
       " '医学专员',\n",
       " '桥梁工程师',\n",
       " '客户专员（管培生）',\n",
       " '解决方案',\n",
       " '高级业务架构师',\n",
       " '政企域支撑工程师-5（外包岗）',\n",
       " '内训师',\n",
       " '渠道销售',\n",
       " '直播运营专员',\n",
       " '售前工程师',\n",
       " '政企域支撑工程师-3（外包岗）',\n",
       " '交易风控员',\n",
       " '实施工程师 ',\n",
       " '伺服研发工程师',\n",
       " '游戏测试工程师',\n",
       " '终端培训师',\n",
       " '校招岗位',\n",
       " '私有云运维工程师（广州 深圳）',\n",
       " '运维工程师（上海 深圳）',\n",
       " '数字化创新人才',\n",
       " '体验店顾问',\n",
       " '影视动画设计师',\n",
       " '直播审核岗',\n",
       " '电商战略分析师',\n",
       " '服务体验顾问',\n",
       " '技术支持',\n",
       " '会计实习生',\n",
       " '天猫运营',\n",
       " '管理培训生（技术支持方向）']"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "def GetJobClassify(job_name_list,key_words_list):\n",
    "    res = []\n",
    "    for i in job_name_list:\n",
    "        for j in key_words_list:\n",
    "            if j in i:\n",
    "                res.append(i)\n",
    "                # break\n",
    "    return res\n",
    "\n",
    "DataerKeyWords = [\"经理\",\"产品经理\"]                    # 放入Data类\n",
    "\n",
    "BigDataKeyWords = [\"大数据\",\"数仓\"]\n",
    "\n",
    "AIKeyWords = [\"自然语言处理\" , \"NLP\" , \"nlp\" , \"AI\", \"ai\" , \"算法\",\"深度学习\",\"图像处理\" , \"cv\" , \"计算机视觉\" , \"CV\" , \"视觉\" ,\"机器学习\" , \"数据挖掘\" ]\n",
    "\n",
    "DataKeyWords = [\"数据\" , \"Data Analyst\" , \"ETL\" , \"BI\"]\n",
    "\n",
    "\n",
    "\n",
    "DevelopKeyWords = [\"开发\" , \"前端\" , \"后端\" ,\"后台\" ,\"python\" , \"java\" , \"爬虫\" , \"Python\" , \"php\" , \"JAVA\" , \"算法\"]           # 软件开发类\n",
    "\n",
    "Dataer = GetJobClassify(job_name_list,DataerKeyWords)\n",
    "job_name_list = list(set(job_name_list).difference(Dataer))\n",
    "\n",
    "\n",
    "BigData = GetJobClassify(job_name_list,BigDataKeyWords)\n",
    "job_name_list = list(set(job_name_list).difference(BigData))\n",
    "\n",
    "AI = GetJobClassify(job_name_list,AIKeyWords)\n",
    "job_name_list = list(set(job_name_list).difference(AI))\n",
    "\n",
    "Data = GetJobClassify(job_name_list,DataKeyWords)\n",
    "job_name_list = list(set(job_name_list).difference(Data))\n",
    "\n",
    "\n",
    "Develop = GetJobClassify(job_name_list,DevelopKeyWords)\n",
    "job_name_list = list(set(job_name_list).difference(Develop))\n",
    "\n",
    "Data = Data+Dataer\n",
    "other = job_name_list\n",
    "other"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "{'水利大数据分析师': '大数据开发类',\n",
       " '大数据系统分析师': '大数据开发类',\n",
       " '大数据销售助理': '大数据开发类',\n",
       " '计算机大数据推广专员': '大数据开发类',\n",
       " '大数据架构师': '大数据开发类',\n",
       " '大数据应用开发工程师': '大数据开发类',\n",
       " '大数据工程师': '大数据开发类',\n",
       " '工业大数据工程师': '大数据开发类',\n",
       " '数仓开发': '大数据开发类',\n",
       " '大数据分析员': '大数据开发类',\n",
       " '大数据分析实习生': '大数据开发类',\n",
       " '运维工程师（大数据）': '大数据开发类',\n",
       " '大数据开发实习生': '大数据开发类',\n",
       " '车联网大数据运用': '大数据开发类',\n",
       " '大数据开发工程师（数据治理）': '大数据开发类',\n",
       " '数据治理/大数据设计工程师': '大数据开发类',\n",
       " '高级大数据开发工程师 Hadoop Hive': '大数据开发类',\n",
       " '大数据开发工程师-运通信息': '大数据开发类',\n",
       " '大数据分析师（BI）': '大数据开发类',\n",
       " '大数据开发工程师（数据治理中级)': '大数据开发类',\n",
       " '大数据开发工程师': '大数据开发类',\n",
       " '大数据实习生': '大数据开发类',\n",
       " '大数据分析师': '大数据开发类',\n",
       " '大数据运营实习生': '大数据开发类',\n",
       " '41071-腾讯会议NLP算法工程师（广州）': '人工智能类',\n",
       " '自然语言处理工程师': '人工智能类',\n",
       " '【总部研发】计算机视觉工程师': '人工智能类',\n",
       " 'NLP算法研究员': '人工智能类',\n",
       " 'AI算法工程师（实习）': '人工智能类',\n",
       " 'NLP算法工程师 (MJ000080)': '人工智能类',\n",
       " 'NLP自然语言处理工程师': '人工智能类',\n",
       " '人工智能平台 NLP算法工程师（02）': '人工智能类',\n",
       " '数据分析师（数据挖掘方向）': '人工智能类',\n",
       " '机器学习和深度学习师': '人工智能类',\n",
       " 'NLP算法工程师（专家）': '人工智能类',\n",
       " '计算机视觉算法工程师（深度...': '人工智能类',\n",
       " 'AI数据标注师': '人工智能类',\n",
       " '算法工程师（NLP方向）': '人工智能类',\n",
       " '数据挖掘工程师': '人工智能类',\n",
       " '计算机视觉算法工程师 (MJ004259)': '人工智能类',\n",
       " '图像算法工程师': '人工智能类',\n",
       " '计算机视觉工程师': '人工智能类',\n",
       " '数据分析工程师（NLP方向）(J11892)': '人工智能类',\n",
       " '算法工程师（推荐/NLP/机器学习）': '人工智能类',\n",
       " '自然语言处理工程师（NLP）': '人工智能类',\n",
       " 'WXG03-微信公众平台NLP算法工程师（广州）': '人工智能类',\n",
       " 'WXG11-微信读书算法工程师（自然语言处理方向）（广州）': '人工智能类',\n",
       " 'NLP算法工程师（接受优秀应届毕业生）': '人工智能类',\n",
       " 'nlp算法工程师': '人工智能类',\n",
       " '机器学习算法研发工程师（嵌入式软件）': '人工智能类',\n",
       " '计算机视觉算法工程师 (MJ001970)': '人工智能类',\n",
       " 'AI平台研发工程师（实习）': '人工智能类',\n",
       " 'NLP算法工程师(J10631)': '人工智能类',\n",
       " 'NLP算法工程师MJ000171(COG)': '人工智能类',\n",
       " '图像&NLP 算法工程师(J10323)': '人工智能类',\n",
       " '自然语言处理/NLP工程师（2019校园招聘）': '人工智能类',\n",
       " '算法工程师': '人工智能类',\n",
       " '数据挖掘工程师（自然语言处理）': '人工智能类',\n",
       " '计算机视觉算法工程师 (MJ000510)': '人工智能类',\n",
       " '计算机视觉算法工程师': '人工智能类',\n",
       " 'WXG01-微信视频号内容理解CV/NLP算法工程师（广州/深圳）': '人工智能类',\n",
       " '语音前端算法研发工程师  ': '人工智能类',\n",
       " '资深NLP算法工程师': '人工智能类',\n",
       " 'NLP高级工程师': '人工智能类',\n",
       " '视觉应用工程师': '人工智能类',\n",
       " '计算机视觉语义理解算法工程师': '人工智能类',\n",
       " 'BIGO_图像处理和深度学习工程师（资深）（北京/广州/上海/新加坡） (MJ003262)': '人工智能类',\n",
       " 'AI类数据标注': '人工智能类',\n",
       " 'NLP算法工程师': '人工智能类',\n",
       " '自然语言处理算法工程师': '人工智能类',\n",
       " '高级算法工程师（自然语言处理方向）': '人工智能类',\n",
       " '科学家/研究员/工程师（NLP）-创新工场AI工程院': '人工智能类',\n",
       " 'nlp工程师': '人工智能类',\n",
       " '高级nlp算法工程师': '人工智能类',\n",
       " '资深计算机视觉算法工程师': '人工智能类',\n",
       " '图形图像算法工程师（广州/北京）': '人工智能类',\n",
       " '交互与视觉设计': '人工智能类',\n",
       " '自然语言处理/NLP工程师': '人工智能类',\n",
       " 'NLP工程师': '人工智能类',\n",
       " 'WXG08-微信搜一搜NLP算法工程师（北京/广州）（广州）': '人工智能类',\n",
       " '高级AI工程师（自然语言处理方向）': '人工智能类',\n",
       " '人工智能平台 NLP工程师（01）': '人工智能类',\n",
       " '计算机视觉算法高级工程师-AI审核方向': '人工智能类',\n",
       " '计算机视觉算法研究工程师': '人工智能类',\n",
       " 'NLP 算法工程师': '人工智能类',\n",
       " 'NLP自然语言处理工程师(J10611)': '人工智能类',\n",
       " 'NLP算法专家/工程师': '人工智能类',\n",
       " '计算机视觉研发工程师': '人工智能类',\n",
       " 'NLP算法工程师 (MJ003321)': '人工智能类',\n",
       " '算法工程师 - 自然语言处理': '人工智能类',\n",
       " '数据挖掘分析师': '人工智能类',\n",
       " 'nlp高级算法工程师': '人工智能类',\n",
       " '数据工程师实习生': '数据分析类',\n",
       " '数据标注员': '数据分析类',\n",
       " '生物信息数据分析员': '数据分析类',\n",
       " '电商数据分析': '数据分析类',\n",
       " '电商数据分析师（行业分析）': '数据分析类',\n",
       " '数据实施工程师': '数据分析类',\n",
       " '数据分析师（发展前景+双休）': '数据分析类',\n",
       " '高级数据分析师 (MJ003580)': '数据分析类',\n",
       " 'WXG11-微信读书数据分析师（内容分析方向）': '数据分析类',\n",
       " '数据治理工程师-广州': '数据分析类',\n",
       " '数据仓库工程师': '数据分析类',\n",
       " '数据分析师(业务方向)': '数据分析类',\n",
       " '业务数据分析师': '数据分析类',\n",
       " '数据分析专员（内审-反舞弊方向）(027932)': '数据分析类',\n",
       " '数据分析师（商业地产及零售行业）': '数据分析类',\n",
       " '跨境电商数据分析专员': '数据分析类',\n",
       " 'Planning Analyst 数据分析员': '数据分析类',\n",
       " '地图数据加工处理专员': '数据分析类',\n",
       " '电商数据分析师/资深分析师': '数据分析类',\n",
       " '百度数据标注员': '数据分析类',\n",
       " '数据库开发工程师': '数据分析类',\n",
       " '数据处理员': '数据分析类',\n",
       " '数据分析员（数据统计员0': '数据分析类',\n",
       " '商业数据分析师': '数据分析类',\n",
       " '高级数据安全治理工程师': '数据分析类',\n",
       " '数据分析师（数据BP)': '数据分析类',\n",
       " 'WXG01-微信视频号数据分析师': '数据分析类',\n",
       " 'ETL开发工程师 (MJ001915)': '数据分析类',\n",
       " '数据分析师 - 国际化直播': '数据分析类',\n",
       " 'ETL工程师': '数据分析类',\n",
       " '电商数据分析师（人群运营）': '数据分析类',\n",
       " '资源管理岗（数据方向）': '数据分析类',\n",
       " '数据分析师（投放向） (MJ000326)': '数据分析类',\n",
       " '高级ETL开发工程师': '数据分析类',\n",
       " '电商产品数据分析(J10169)': '数据分析类',\n",
       " 'BA商业分析师/数据分析师': '数据分析类',\n",
       " '数据分析师(编号D1#0723）': '数据分析类',\n",
       " '资深数据分析专员': '数据分析类',\n",
       " '数据分析师（需驻场南沙）': '数据分析类',\n",
       " '遗留数据分析专员': '数据分析类',\n",
       " 'BA Data analyst 数据分析师': '数据分析类',\n",
       " '数据分析专员-海外业务': '数据分析类',\n",
       " '贝壳找房-广州站-数据分析专员': '数据分析类',\n",
       " 'BI项目工程师（ETL开发）': '数据分析类',\n",
       " '统计员/数据专员/结算专员': '数据分析类',\n",
       " '仓储资深专员（数据分析） (MJ002468)': '数据分析类',\n",
       " 'ETL/BI/数据库开发工程师': '数据分析类',\n",
       " '数据分析师（业务分析）+周末双休+朝九晚六': '数据分析类',\n",
       " '客服中心运营专员（数据分析）': '数据分析类',\n",
       " '数据分析师助理': '数据分析类',\n",
       " '临床数据分析员': '数据分析类',\n",
       " '解决方案顾问/数据分析师': '数据分析类',\n",
       " '高级数据分析师(业务分析)(J10275)': '数据分析类',\n",
       " '高级数据分析师（广州） (MJ000686)': '数据分析类',\n",
       " '数据建模分析师': '数据分析类',\n",
       " '数据分析运营专员': '数据分析类',\n",
       " '数据采集分析员': '数据分析类',\n",
       " '商务/数据分析师': '数据分析类',\n",
       " '数据分析师（广东联通）': '数据分析类',\n",
       " '高德地图数据编辑': '数据分析类',\n",
       " 'Tableau 数据分析师': '数据分析类',\n",
       " '高级数据分析师（地产） (MJ000524)': '数据分析类',\n",
       " '(高级）数据分析师': '数据分析类',\n",
       " 'Data Analyst/Business Analyst': '数据分析类',\n",
       " '销售数据分析员（广州）': '数据分析类',\n",
       " '金融数据分析师': '数据分析类',\n",
       " '桥梁健康监测数据分析师': '数据分析类',\n",
       " '高级数据分析师/主管': '数据分析类',\n",
       " 'Data Analyst': '数据分析类',\n",
       " '数据分析专员（2022届校招）': '数据分析类',\n",
       " 'Senior Digital Consultant/高级数据分析师': '数据分析类',\n",
       " '财务数据分析师': '数据分析类',\n",
       " '数据分析师（电商） (MJ004080)': '数据分析类',\n",
       " 'Analyst/数据分析师 （ICIS 安迅思）': '数据分析类',\n",
       " '数据分析师（国际化） (MJ003534)': '数据分析类',\n",
       " '招聘运营专员-数据分析方向': '数据分析类',\n",
       " '数据工程师': '数据分析类',\n",
       " '数据库管理员': '数据分析类',\n",
       " '数据分析师（商业方向）(77P2)': '数据分析类',\n",
       " '数据支持工程师': '数据分析类',\n",
       " '数据分析师（中级）': '数据分析类',\n",
       " '数据分析员': '数据分析类',\n",
       " '数据治理项目高级开发工程师': '数据分析类',\n",
       " '金融贷后催收数据分析师': '数据分析类',\n",
       " 'ETL开发工程师': '数据分析类',\n",
       " '数据分析师-广州': '数据分析类',\n",
       " 'PYTHON爬虫数据分析师': '数据分析类',\n",
       " '数据分析师（数据开发方向）': '数据分析类',\n",
       " '数据处理实习生': '数据分析类',\n",
       " '屈臣氏渠道专员（数据统计分析方向+近地铁）': '数据分析类',\n",
       " 'BI Engineer/ Data Analyst': '数据分析类',\n",
       " '商务智能及数据仓库工程师': '数据分析类',\n",
       " '行业调研数据分析师（广州-校招）ID94080': '数据分析类',\n",
       " '数据治理工程师（跨境电商）': '数据分析类',\n",
       " '游戏数据研究员': '数据分析类',\n",
       " 'BI实施工程师': '数据分析类',\n",
       " '数据分析助理工程师': '数据分析类',\n",
       " '数据开发-广州银行项目': '数据分析类',\n",
       " '数据分析专员-广州【2022届校招】': '数据分析类',\n",
       " '数据分析': '数据分析类',\n",
       " 'BI工程师': '数据分析类',\n",
       " '数据治理交付工程师': '数据分析类',\n",
       " '资深游戏数据分析师': '数据分析类',\n",
       " '数据分析师（服装品类）': '数据分析类',\n",
       " '数据分析师（运营支持）': '数据分析类',\n",
       " '临床数据分析专员': '数据分析类',\n",
       " '电商高级数据分析师': '数据分析类',\n",
       " '推广与数据分析专员（2020届校园招聘）': '数据分析类',\n",
       " '数据分析师（商业方向）(CNUP)': '数据分析类',\n",
       " '数据分析助理': '数据分析类',\n",
       " '生物信息工程师/临床数据分析师': '数据分析类',\n",
       " '数据库管理员（广州）': '数据分析类',\n",
       " '数据分析初级': '数据分析类',\n",
       " '国际化广告数据分析师': '数据分析类',\n",
       " '数据分析专员(J12095)': '数据分析类',\n",
       " '资深薪酬绩效数据分析专员 (MJ004995)': '数据分析类',\n",
       " '电商数据分析专员': '数据分析类',\n",
       " '数据分析师 (MJ001550)': '数据分析类',\n",
       " 'ETL开发需求（2022校招）': '数据分析类',\n",
       " '薪酬绩效专员（数据分析方向）': '数据分析类',\n",
       " '数据分析师（用户方向）': '数据分析类',\n",
       " '高级运营数据分析师': '数据分析类',\n",
       " '数据分析师/高级数据分析师(J13098)': '数据分析类',\n",
       " '数据分析师（独立站）': '数据分析类',\n",
       " '数据分析师（海外）(J10744)': '数据分析类',\n",
       " '（资深/高级）数据分析师': '数据分析类',\n",
       " '数据分析专家': '数据分析类',\n",
       " '数据开发岗-广州银行项目': '数据分析类',\n",
       " '高级媒介专员（数据分析方向）': '数据分析类',\n",
       " '亚马逊产品开发（数据分析员）（美妆个护时尚方向）': '数据分析类',\n",
       " '总部数据分析专员（主数据方向）': '数据分析类',\n",
       " '数据分析助理初级': '数据分析类',\n",
       " '集团总部-高级数据分析师': '数据分析类',\n",
       " '数据分析师(J10790)': '数据分析类',\n",
       " '数据实习生': '数据分析类',\n",
       " '数据分析师（广州）': '数据分析类',\n",
       " '数据标注工程师': '数据分析类',\n",
       " '开发、数据开发-广州银行项目': '数据分析类',\n",
       " '推广与数据分析专员': '数据分析类',\n",
       " 'BI数据分析师助理': '数据分析类',\n",
       " '客服专员（数据统计）': '数据分析类',\n",
       " '商业分析师/数据分析师': '数据分析类',\n",
       " '数据分析实习生': '数据分析类',\n",
       " '数据分析师（Fine BI/Report）': '数据分析类',\n",
       " '财务数据分析师 (MJ002270)': '数据分析类',\n",
       " '数据分析师（电商平台）': '数据分析类',\n",
       " '数据开发': '数据分析类',\n",
       " '数据运营专员': '数据分析类',\n",
       " '数据运营': '数据分析类',\n",
       " '数据开发工程师': '数据分析类',\n",
       " '游戏数据分析师': '数据分析类',\n",
       " '推广数据分析专员': '数据分析类',\n",
       " '数据管理': '数据分析类',\n",
       " '阿里灵犀互娱-游戏数据分析师-广州': '数据分析类',\n",
       " '数据治理（开发）工程师': '数据分析类',\n",
       " '数据分析工程师': '数据分析类',\n",
       " '数据专员（天猫电商数据分析）': '数据分析类',\n",
       " '数据统计员/客户专员': '数据分析类',\n",
       " '医学统计/数据管理专员': '数据分析类',\n",
       " '项目交付工程师（数据治理）': '数据分析类',\n",
       " '数据治理工程师': '数据分析类',\n",
       " 'bi数据分析师': '数据分析类',\n",
       " '数据分析师(J10380)': '数据分析类',\n",
       " '数据实施实习生': '数据分析类',\n",
       " '数据报表开发': '数据分析类',\n",
       " '环保数据分析员': '数据分析类',\n",
       " 'java开发工程师（数据治理）': '数据分析类',\n",
       " '数据分析师 (MJ000889)': '数据分析类',\n",
       " '电商数据分析师': '数据分析类',\n",
       " '高级/资深数据分析专员2169': '数据分析类',\n",
       " '银行数据分析师': '数据分析类',\n",
       " '数据分析师 (MJ003570)': '数据分析类',\n",
       " 'WXG12-微信安全视频号直播数据分析师（广州）': '数据分析类',\n",
       " '数据分析专员/主任': '数据分析类',\n",
       " '高级数据分析师': '数据分析类',\n",
       " '数据分析师（22届校招）': '数据分析类',\n",
       " 'WXG01-微信基础业务数据分析师（广州）': '数据分析类',\n",
       " '数据分析师-[465681]': '数据分析类',\n",
       " 'WXG02-微信专家数据分析师（广州）': '数据分析类',\n",
       " '数据分析师（BI/数据产品）': '数据分析类',\n",
       " '供应链专员（数据分析）': '数据分析类',\n",
       " '数据分析师（商业方向-广州）': '数据分析类',\n",
       " '数据分析师（营收方向）': '数据分析类',\n",
       " '数据分析师Data Analyst': '数据分析类',\n",
       " '数据分析师-GZ': '数据分析类',\n",
       " '数据分析师（接受优秀应届生）': '数据分析类',\n",
       " '数据分析高级专员': '数据分析类',\n",
       " '人力数据分析师': '数据分析类',\n",
       " '项目数据分析师': '数据分析类',\n",
       " 'WXG01-微信视频号数据分析师（用户增长方向）': '数据分析类',\n",
       " '运营专员（数据分析）': '数据分析类',\n",
       " 'WXG01-微信视频号直播数据分析师': '数据分析类',\n",
       " '医学数据分析师': '数据分析类',\n",
       " 'BI数据分析师': '数据分析类',\n",
       " '数据分析师/BI': '数据分析类',\n",
       " '高级数据分析师（人力资源BI分析师）': '数据分析类',\n",
       " '贝壳找房-广州站-交易数据分析专员': '数据分析类',\n",
       " '（中高级）数据分析师': '数据分析类',\n",
       " '2022届储备干部（商品中心）- 数据分析岗': '数据分析类',\n",
       " '数据分析师（成都） (MJ000049)': '数据分析类',\n",
       " '临床研究数据分析员': '数据分析类',\n",
       " '高级数据分析师（成人教育方向）': '数据分析类',\n",
       " '数据分析师（商业化方向）': '数据分析类',\n",
       " '亚马逊数据分析师': '数据分析类',\n",
       " '视频数据标注': '数据分析类',\n",
       " '人力资源数据分析师': '数据分析类',\n",
       " '数据分析师': '数据分析类',\n",
       " 'WXG10-企业微信数据分析师（广/深/成）-广州': '数据分析类',\n",
       " 'Data Governance数据治理': '数据分析类',\n",
       " '数据分析师 (MJ002723)': '数据分析类',\n",
       " '高级数据分析师（广州）': '数据分析类',\n",
       " '数据分析师 (MJ003742)': '数据分析类',\n",
       " '数据分析师/数据研究员': '数据分析类',\n",
       " '数据实施顾问': '数据分析类',\n",
       " '数据分析师/数据分析主管': '数据分析类',\n",
       " '数据处理工程师': '数据分析类',\n",
       " 'ETL数据库开发工程师': '数据分析类',\n",
       " '商业数据分析专员': '数据分析类',\n",
       " '数据分析专员': '数据分析类',\n",
       " '电网数据分析实习生 ': '数据分析类',\n",
       " '资深数据分析师': '数据分析类',\n",
       " '销售数据分析师': '数据分析类',\n",
       " '管理培训生（数据标注方向）': '数据分析类',\n",
       " '数据分析师（商品方向）': '数据分析类',\n",
       " 'WXG11-微信读书数据分析师（用户分析方向）': '数据分析类',\n",
       " '（高级）数据分析师-顾客体验及数字化业务': '数据分析类',\n",
       " '数据服务部工程师': '数据分析类',\n",
       " '战客部数据分析岗': '数据分析类',\n",
       " '数据分析师 (MJ000210)': '数据分析类',\n",
       " '宝洁项目运营数据分析专员': '数据分析类',\n",
       " '数据处理分析师': '数据分析类',\n",
       " '数据分析专员（新零售事业部）': '数据分析类',\n",
       " 'GIS数据整合工程师助理': '数据分析类',\n",
       " '服装数据分析师': '数据分析类',\n",
       " '高级/资深数据分析师（行业研究方向）(028079)': '数据分析类',\n",
       " '审计专员（数据分析方向）': '数据分析类',\n",
       " '高级数据分析专员（游戏广告）': '数据分析类',\n",
       " '数据分析师（电商护肤品+CBD猎德地铁站）': '数据分析类',\n",
       " '投放数据分析专员': '数据分析类',\n",
       " '高级数据分析师（新零售方向）': '数据分析类',\n",
       " '销售数据分析专员': '数据分析类',\n",
       " '集团总部-数据治理工程师': '数据分析类',\n",
       " '中级数据分析师-广州': '数据分析类',\n",
       " '商品数据分析专员': '数据分析类',\n",
       " '数据安全高级经理': '数据分析类',\n",
       " '数据安全项目经理': '数据分析类',\n",
       " '数据产品经理': '数据分析类',\n",
       " '销售经理': '数据分析类',\n",
       " '互联网产品经理': '数据分析类',\n",
       " '数据分析经理': '数据分析类',\n",
       " '物流招商经理': '数据分析类',\n",
       " 'pmo项目经理': '数据分析类',\n",
       " '人力资源经理': '数据分析类',\n",
       " 'IT运维经理': '数据分析类',\n",
       " '咨询经理': '数据分析类',\n",
       " '产品经理': '数据分析类',\n",
       " '大数据产品经理': '数据分析类',\n",
       " '高级产品经理': '数据分析类',\n",
       " '数据产品技术经理': '数据分析类',\n",
       " '大文娱互动娱乐事业部-高级数据产品经理-买量平台': '数据分析类',\n",
       " '高级数据分析师（经理级）': '数据分析类',\n",
       " '商业化数据产品经理': '数据分析类',\n",
       " '数据产品经理（稻壳）': '数据分析类',\n",
       " '运营数据产品经理': '数据分析类',\n",
       " '产品行销经理': '数据分析类',\n",
       " '测试经理（数据库产品）': '数据分析类',\n",
       " '产品经理（支付/后端）': '数据分析类',\n",
       " '制药行业主数据产品经理': '数据分析类',\n",
       " '零售行业主数据产品经理(J10281)': '数据分析类',\n",
       " '高级数据产品经理': '数据分析类',\n",
       " 'TiDB数据库高级产品经理': '数据分析类',\n",
       " '数据库内核产品经理': '数据分析类',\n",
       " '数据产品运营经理-GZ': '数据分析类',\n",
       " '高级客户经理（气象大数据产品）': '数据分析类',\n",
       " '产品经理（气象大数据产品）': '数据分析类',\n",
       " '数据治理/数据中台产品经理': '数据分析类',\n",
       " '数据产品经理（商业化方向）': '数据分析类',\n",
       " '数据产品经理/高级经理': '数据分析类',\n",
       " '数据中台产品经理': '数据分析类',\n",
       " '大数据产品经理（智能网联合资公司）': '数据分析类',\n",
       " '大数据产品经理（数字营销方向）': '数据分析类',\n",
       " '大数据算法产品经理': '数据分析类',\n",
       " '产品经理（数据方向）': '数据分析类',\n",
       " '大数据应用产品经理': '数据分析类',\n",
       " '大数据应用产品经理（中高级）': '数据分析类',\n",
       " '大数据高级产品经理': '数据分析类',\n",
       " '大数据产品经理/总监': '数据分析类',\n",
       " '大数据产品经理 校招': '数据分析类',\n",
       " '数据产品经理（可视化工具）': '数据分析类',\n",
       " '数据产品经理（初中级）': '数据分析类',\n",
       " '数据产品经理 (MJ000031)': '数据分析类',\n",
       " '产品经理（家具）(J10169)': '数据分析类',\n",
       " '爆品产品经理(J10169)': '数据分析类',\n",
       " '电商产品经理(J10169)': '数据分析类',\n",
       " '财务数据产品经理（BI）(J11008)': '数据分析类',\n",
       " 'PM产品经理（数据中台）': '数据分析类',\n",
       " '大数据平台产品经理': '数据分析类',\n",
       " '数据产品经理(J10954)': '数据分析类',\n",
       " '商管系统产品经理': '数据分析类',\n",
       " '行业门户APP产品经理': '数据分析类',\n",
       " '选址SAAS产品经理': '数据分析类',\n",
       " '广州产品经理': '数据分析类',\n",
       " '产品经理（大数据后台）': '数据分析类',\n",
       " '大数据后台产品经理': '数据分析类',\n",
       " '产品经理（大数据应用）': '数据分析类',\n",
       " '产品经理（大数据项目）': '数据分析类',\n",
       " '商品企划经理': '数据分析类',\n",
       " '数据平台产品（专业）经理': '数据分析类',\n",
       " '资深数据产品经理': '数据分析类',\n",
       " '产品经理（数据类）': '数据分析类',\n",
       " '产品经理（大数据方向）': '数据分析类',\n",
       " '数据平台产品经理': '数据分析类',\n",
       " '数据平台产品经理 (MJ004500)': '数据分析类',\n",
       " '数据产品经理/专家': '数据分析类',\n",
       " '数据产品经理 (MJ003187)': '数据分析类',\n",
       " '数据产品经理（电商） (MJ004437)': '数据分析类',\n",
       " '数据安全产品经理 (MJ004420)': '数据分析类',\n",
       " '数据产品经理 (MJ000702)': '数据分析类',\n",
       " '大数据产品经理（高级）': '数据分析类',\n",
       " '大数据产品销售经理': '数据分析类',\n",
       " '高级产品经理（大数据平台）': '数据分析类',\n",
       " '数据产品经理(J12754)': '数据分析类',\n",
       " '大数据产品经理-公安行业': '数据分析类',\n",
       " '数据产品经理(J34YP)': '数据分析类',\n",
       " '金融数据采编/数据产品经理': '数据分析类',\n",
       " '电商数据产品经理': '数据分析类',\n",
       " '数据产品经理 / BI实施顾问 (职位编号：CP10)': '数据分析类',\n",
       " '数据部产品经理': '数据分析类',\n",
       " '大数据产品经理/主管': '数据分析类',\n",
       " '互联网/大数据产品经理': '数据分析类',\n",
       " '产品经理（医疗大数据）': '数据分析类',\n",
       " '数据应用产品经理': '数据分析类',\n",
       " '项目经理（数据类产品）': '数据分析类',\n",
       " '产品经理（数据产品）': '数据分析类',\n",
       " '数据产品经理（渠道/经销商）': '数据分析类',\n",
       " '高级数据分析师/数据分析经理': '数据分析类',\n",
       " '数据产品高级经理': '数据分析类',\n",
       " '数据产品经理 (MJ000035)': '数据分析类',\n",
       " '数据中台产品经理（地产方向）': '数据分析类',\n",
       " '数据产品经理（MJ000102）': '数据分析类',\n",
       " '数据产品经理（SAAS方向）（MJ000457）': '数据分析类',\n",
       " '数据产品经理 (MJ000102)': '数据分析类',\n",
       " '数据产品经理 (MJ000067)': '数据分析类',\n",
       " '数据产品经理（发行业务）': '数据分析类',\n",
       " '产品规划经理': '数据分析类',\n",
       " '数据应用产品经理（MJ000408）': '数据分析类',\n",
       " '数据平台产品经理（MJ000458）': '数据分析类',\n",
       " 'PDM产品经理': '数据分析类',\n",
       " '产品经理（数据智能）': '数据分析类',\n",
       " 'BI工程师（数据产品经理方向）': '数据分析类',\n",
       " '研究经理/高级数据分析师': '数据分析类',\n",
       " '产品经理（数据中台/AI中台）': '数据分析类',\n",
       " '数据中台资深产品经理2355': '数据分析类',\n",
       " '产品经理（大数据分析）': '数据分析类',\n",
       " '财税产品经理': '数据分析类',\n",
       " '产品总监/高级产品经理': '数据分析类',\n",
       " '大数据产品高级经理': '数据分析类',\n",
       " '数据运营经理（数据分析师）': '数据分析类',\n",
       " '产品经理（数据分析方向）': '数据分析类',\n",
       " '数据产品运营经理': '数据分析类',\n",
       " '数据治理产品经理': '数据分析类',\n",
       " '科研大数据产品经理': '数据分析类',\n",
       " '工业大数据产品经理': '数据分析类',\n",
       " '产品经理（大数据））': '数据分析类',\n",
       " '数据产品经理（采集方向）': '数据分析类',\n",
       " '医疗大数据产品经理': '数据分析类',\n",
       " '数据安全产品经理': '数据分析类',\n",
       " '数据产品经理&BI分析师': '数据分析类',\n",
       " '产品 经理': '数据分析类',\n",
       " '增长运营经理': '数据分析类',\n",
       " '云产品销售经理': '数据分析类',\n",
       " '产品销售经理（金融BI/大数据）': '数据分析类',\n",
       " '高级大数据产品经理': '数据分析类',\n",
       " '产品经理（家具）': '数据分析类',\n",
       " 'WXG10-211 企业微信产品运营经理（数据/增长，广州）': '数据分析类',\n",
       " 'WXG10-企业微信产品运营经理（数据分析方向）': '数据分析类',\n",
       " 'WXG03-小程序产品经理(数据分析方向)': '数据分析类',\n",
       " 'WXG12-数据合规产品运营经理（广州）': '数据分析类',\n",
       " 'WXG03-微信公众平台数据策略产品经理（广州）': '数据分析类',\n",
       " 'WXG10-企业微信数据策略产品经理（广州/深圳/成都）（广州）': '数据分析类',\n",
       " '数据中台实施项目经理': '数据分析类',\n",
       " '高级产品经理（数据平台）': '数据分析类',\n",
       " '资深数据分析师/数据分析经理': '数据分析类',\n",
       " 'WXG01-微信数据平台产品经理': '数据分析类',\n",
       " 'CSIG08-数据产品经理': '数据分析类',\n",
       " '产品经理（大数据）': '数据分析类',\n",
       " '产品经理（数据中台）': '数据分析类',\n",
       " '数据产品经理/产品经理（B端）': '数据分析类',\n",
       " '数据产品经理（数据治理方向）': '数据分析类',\n",
       " '大数据产品经理岗': '数据分析类',\n",
       " '大客户销售经理': '数据分析类',\n",
       " '项目经理': '数据分析类',\n",
       " '项目经理储备（深圳）': '数据分析类',\n",
       " '客户经理': '数据分析类',\n",
       " '爬虫架构师': '软件开发类',\n",
       " 'NET开发（实习生/应届生）': '软件开发类',\n",
       " 'Python工程师': '软件开发类',\n",
       " 'Web后台开发工程师': '软件开发类',\n",
       " '软件测试开发工程师': '软件开发类',\n",
       " '高级python爬虫工程师': '软件开发类',\n",
       " '前端开发工程师': '软件开发类',\n",
       " '开发-广州银行项目': '软件开发类',\n",
       " 'Android应用开发工程师': '软件开发类',\n",
       " 'JAVA开发工程师': '软件开发类',\n",
       " '前端开发工程师-运通信息': '软件开发类',\n",
       " '嵌入式软件开发工程师（Linux方向）': '软件开发类',\n",
       " '鸿蒙应用开发工程师': '软件开发类',\n",
       " 'JAVA工程师': '软件开发类',\n",
       " 'Java高级开发工程师': '软件开发类',\n",
       " '软件开发工程师': '软件开发类',\n",
       " '鸿蒙硬件开发工程师': '软件开发类',\n",
       " 'Java开发工程师': '软件开发类',\n",
       " 'php工程师': '软件开发类',\n",
       " ' JAVA开发工程师': '软件开发类',\n",
       " '前端开发工程师（实习生） ': '软件开发类',\n",
       " 'JAVA开发': '软件开发类',\n",
       " 'Web前端开发工程师': '软件开发类',\n",
       " '游戏服务端开发': '软件开发类',\n",
       " 'etl开发工程师': '软件开发类',\n",
       " 'Java开发工程师-运通信息': '软件开发类',\n",
       " 'web前端开发工程师': '软件开发类',\n",
       " '.NET开发工程师': '软件开发类',\n",
       " 'Java软件开发工程师': '软件开发类',\n",
       " 'Java开发工程师（广州/重庆/福州都有招聘）': '软件开发类',\n",
       " 'java开发岗': '软件开发类',\n",
       " '技术后端': '软件开发类',\n",
       " 'Python爬虫工程师': '软件开发类',\n",
       " 'Java初级开发工程师': '软件开发类',\n",
       " 'Python/django后台开发工程师': '软件开发类',\n",
       " 'C/C++软件开发工程师': '软件开发类',\n",
       " '前端开发工程师--运通信息': '软件开发类',\n",
       " '开发工程师': '软件开发类',\n",
       " '前端工程师 ': '软件开发类',\n",
       " 'python工程师': '软件开发类',\n",
       " '前端工程师': '软件开发类',\n",
       " '爬虫工程师': '软件开发类',\n",
       " 'Java开发工程师--运通信息': '软件开发类',\n",
       " '直播运营实习生': '其他类',\n",
       " 'RPA实施工程师': '其他类',\n",
       " '结构设计师': '其他类',\n",
       " '高级生信分析工程师': '其他类',\n",
       " '知识专员': '其他类',\n",
       " '售前技术支持': '其他类',\n",
       " '项目助理岗-广州银行项目': '其他类',\n",
       " '技术管理岗': '其他类',\n",
       " '技术服务工程师': '其他类',\n",
       " '在线客服': '其他类',\n",
       " '商务拓展（BD）总监': '其他类',\n",
       " 'CRM主管': '其他类',\n",
       " '线上服务顾问': '其他类',\n",
       " '销售专员': '其他类',\n",
       " '产业链数字专员': '其他类',\n",
       " '渠道运营总监': '其他类',\n",
       " '产品总监': '其他类',\n",
       " '企业培训售前咨询': '其他类',\n",
       " '电商运营': '其他类',\n",
       " 'HRIS': '其他类',\n",
       " '数字化工程师': '其他类',\n",
       " '项目管理': '其他类',\n",
       " '2022校园招聘-市场营运类': '其他类',\n",
       " '测试(高级)-广州银行项目': '其他类',\n",
       " '医学顾问（消化内科方向）': '其他类',\n",
       " '会计': '其他类',\n",
       " '服务解决方案工程师': '其他类',\n",
       " '主播': '其他类',\n",
       " '应用环境支持-广州银行项目': '其他类',\n",
       " '测试工程师': '其他类',\n",
       " '实习生': '其他类',\n",
       " '质检工程师': '其他类',\n",
       " '服务技术顾问': '其他类',\n",
       " '销售工程师': '其他类',\n",
       " '实施顾问': '其他类',\n",
       " '创意设计': '其他类',\n",
       " '区域督导': '其他类',\n",
       " '研发文员': '其他类',\n",
       " '售后工程师': '其他类',\n",
       " '产品运营实习生': '其他类',\n",
       " '管理培训生（软件研发方向）': '其他类',\n",
       " '需求分析岗-广州银行项目': '其他类',\n",
       " '抖音/快手/视频号主播': '其他类',\n",
       " '计费支撑工程师（外包岗）': '其他类',\n",
       " '教学助理': '其他类',\n",
       " '客服顾问': '其他类',\n",
       " '团队运营管理实习生': '其他类',\n",
       " '遗留判定分析工程师': '其他类',\n",
       " '渠道拓客专员/实习生': '其他类',\n",
       " '电商客服': '其他类',\n",
       " '驻场oppo-测试工程师': '其他类',\n",
       " '值班监控工程师（外包岗）': '其他类',\n",
       " '量化实习生': '其他类',\n",
       " '管培生': '其他类',\n",
       " '实习生岗位': '其他类',\n",
       " '运营助理': '其他类',\n",
       " '网络工程师/系统工程师（广州）': '其他类',\n",
       " '运维工程师（深圳 长沙）': '其他类',\n",
       " '产品实施工程师': '其他类',\n",
       " '销售专员1': '其他类',\n",
       " '外贸销售': '其他类',\n",
       " '需求分析师': '其他类',\n",
       " '天猫助理': '其他类',\n",
       " '运维工程师': '其他类',\n",
       " '游戏测试': '其他类',\n",
       " '企业合作专员': '其他类',\n",
       " '销售助理': '其他类',\n",
       " '产品助理': '其他类',\n",
       " '产品助理(SX)': '其他类',\n",
       " '嵌入式软件工程师': '其他类',\n",
       " '销售代表': '其他类',\n",
       " '电源工程师': '其他类',\n",
       " '游戏研发工程师': '其他类',\n",
       " '新零售管培生': '其他类',\n",
       " '选品员': '其他类',\n",
       " '电商运营助理': '其他类',\n",
       " '互联网运营': '其他类',\n",
       " '测试(初级)-广州银行项目': '其他类',\n",
       " '游戏客服专员': '其他类',\n",
       " '终端销售代表': '其他类',\n",
       " '电商助理': '其他类',\n",
       " '电商客服专员': '其他类',\n",
       " '视频审核岗': '其他类',\n",
       " '院校咨询招生': '其他类',\n",
       " '账务支撑工程师（外包岗）': '其他类',\n",
       " '软件测试工程师': '其他类',\n",
       " '运维工程师（北京 上海 深圳 长沙）': '其他类',\n",
       " '大客户销售': '其他类',\n",
       " '游戏用户营销（GS）专员-岗位JD': '其他类',\n",
       " '技术文章撰写实习生': '其他类',\n",
       " '运维部-Mysql-DBA': '其他类',\n",
       " '工程师助理': '其他类',\n",
       " '硬件测试工程师': '其他类',\n",
       " '体验顾问': '其他类',\n",
       " '分析工程师': '其他类',\n",
       " '中国移动10086客户服务代表\\n': '其他类',\n",
       " '项目负责人': '其他类',\n",
       " '银行账单分期专员': '其他类',\n",
       " '助理检测师': '其他类',\n",
       " '客服专员': '其他类',\n",
       " '营业支撑工程师（外包岗）': '其他类',\n",
       " '管理培训生（销售方向）': '其他类',\n",
       " '平面设计师': '其他类',\n",
       " '测试岗-广州银行项目': '其他类',\n",
       " '游戏策划实习生': '其他类',\n",
       " '测试(中级)-广州银行项目': '其他类',\n",
       " '游戏GS': '其他类',\n",
       " '成本预算工程师': '其他类',\n",
       " '广州银行账单分期+六险一金+高温补贴': '其他类',\n",
       " '合同专员': '其他类',\n",
       " '新媒体运营（线上商机）专员/实习生': '其他类',\n",
       " '软件测试': '其他类',\n",
       " '嵌入式软件实习生': '其他类',\n",
       " '射频工程师': '其他类',\n",
       " '院校合作专员': '其他类',\n",
       " '产品专员': '其他类',\n",
       " '2022校招-优粤生': '其他类',\n",
       " '电力工程师/技术员': '其他类',\n",
       " '销售助理/销售代表 ': '其他类',\n",
       " '售后和实施工程师': '其他类',\n",
       " '运营专员': '其他类',\n",
       " ' 技术支持': '其他类',\n",
       " '硬件技术支持': '其他类',\n",
       " '比价审核岗': '其他类',\n",
       " 'PCB工程师': '其他类',\n",
       " '人事专员': '其他类',\n",
       " '试验检测工程（员）师': '其他类',\n",
       " '软件技术支持 ': '其他类',\n",
       " '新媒体运营助理': '其他类',\n",
       " '运维工程师（长沙 深圳）': '其他类',\n",
       " '游戏客服专员-岗位JD': '其他类',\n",
       " '硬件工程师': '其他类',\n",
       " '初级安服工程师': '其他类',\n",
       " '实施工程师': '其他类',\n",
       " '国际物流客服专员': '其他类',\n",
       " '呼叫专员/实习生': '其他类',\n",
       " '创新俱乐部成员': '其他类',\n",
       " '医学专员': '其他类',\n",
       " '桥梁工程师': '其他类',\n",
       " '客户专员（管培生）': '其他类',\n",
       " '解决方案': '其他类',\n",
       " '高级业务架构师': '其他类',\n",
       " '政企域支撑工程师-5（外包岗）': '其他类',\n",
       " '内训师': '其他类',\n",
       " '渠道销售': '其他类',\n",
       " '直播运营专员': '其他类',\n",
       " '售前工程师': '其他类',\n",
       " '政企域支撑工程师-3（外包岗）': '其他类',\n",
       " '交易风控员': '其他类',\n",
       " '实施工程师 ': '其他类',\n",
       " '伺服研发工程师': '其他类',\n",
       " '游戏测试工程师': '其他类',\n",
       " '终端培训师': '其他类',\n",
       " '校招岗位': '其他类',\n",
       " '私有云运维工程师（广州 深圳）': '其他类',\n",
       " '运维工程师（上海 深圳）': '其他类',\n",
       " '数字化创新人才': '其他类',\n",
       " '体验店顾问': '其他类',\n",
       " '影视动画设计师': '其他类',\n",
       " '直播审核岗': '其他类',\n",
       " '电商战略分析师': '其他类',\n",
       " '服务体验顾问': '其他类',\n",
       " '技术支持': '其他类',\n",
       " '会计实习生': '其他类',\n",
       " '天猫运营': '其他类',\n",
       " '管理培训生（技术支持方向）': '其他类'}"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "BigDataDic = dict(zip(BigData,[\"大数据开发类\"]*len(BigData)))\n",
    "AIDic = dict(zip(AI,[\"人工智能类\"]*len(AI)))\n",
    "DataDic = dict(zip(Data,[\"数据分析类\"]*len(Data)))\n",
    "DevelopDic = dict(zip(Develop,[\"软件开发类\"]*len(Develop)))\n",
    "otherDic = dict(zip(other,[\"其他类\"]*len(other)))\n",
    "all_dic = {**BigDataDic,**AIDic,**DataDic,**DevelopDic,**otherDic}\n",
    "all_dic"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "Job['positionName2'] = Job['positionName']\n",
    "Job['positionName2'] = Job['positionName2'].map(all_dic)"
   ]
  },
  {
   "attachments": {},
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## People分类"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>expectPosition</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>Hadoop大数据开发工程师|数据分析师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>Hadoop大数据开发工程师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>数据分析师|数据挖掘工程师|图像处理工程师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>数据分析师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8276</th>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8277</th>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8278</th>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8279</th>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8280</th>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>8281 rows × 1 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "             expectPosition\n",
       "0      Hadoop大数据开发工程师|数据分析师\n",
       "1            Hadoop大数据开发工程师\n",
       "2     数据分析师|数据挖掘工程师|图像处理工程师\n",
       "3                     数据分析师\n",
       "4             数据分析师|数据挖掘工程师\n",
       "...                     ...\n",
       "8276          数据分析师|数据挖掘工程师\n",
       "8277          数据分析师|数据挖掘工程师\n",
       "8278          数据分析师|数据挖掘工程师\n",
       "8279          数据分析师|数据挖掘工程师\n",
       "8280          数据分析师|数据挖掘工程师\n",
       "\n",
       "[8281 rows x 1 columns]"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "job_name = People[[\"expectPosition\"]]\n",
    "job_name"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [],
   "source": [
    "all_job = [i.split(\"|\") for i in job_name['expectPosition'].values]\n",
    "\n",
    "PeoplePositionDic = {\"数据分析师\":\"数据分析类\",\n",
    "                     \"Hadoop大数据开发工程师\":\"大数据开发类\",\n",
    "                     \"自然语言处理工程师\":\"人工智能类\",\n",
    "                     \"图像处理工程师\":\"人工智能类\",\n",
    "                     \"计算机视觉工程师\":\"人工智能类\",\n",
    "                     \"机器学习工程师\":\"人工智能类\",\n",
    "                     \"算法工程师\":\"人工智能类|软件开发类\",\n",
    "                     \"数据挖掘工程师\":\"人工智能类\",\n",
    "                     \"其他\":\"其他类\"}\n",
    "People[\"expectPosition2\"] = [\"|\".join(set([PeoplePositionDic[j] for j in i])) for i in all_job]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>resumeId</th>\n",
       "      <th>username</th>\n",
       "      <th>gender</th>\n",
       "      <th>jobStatus</th>\n",
       "      <th>exp</th>\n",
       "      <th>expectPosition</th>\n",
       "      <th>willSalaryStart</th>\n",
       "      <th>willSalaryEnd</th>\n",
       "      <th>updateTime</th>\n",
       "      <th>averageSalary</th>\n",
       "      <th>province</th>\n",
       "      <th>city</th>\n",
       "      <th>region</th>\n",
       "      <th>expectPosition2</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>1574625077318778880</td>\n",
       "      <td>谢女士</td>\n",
       "      <td>女</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>Hadoop大数据开发工程师|数据分析师</td>\n",
       "      <td>9000</td>\n",
       "      <td>11000</td>\n",
       "      <td>2022-09-27</td>\n",
       "      <td>10000.0</td>\n",
       "      <td>广东省</td>\n",
       "      <td>深圳市</td>\n",
       "      <td>南山区</td>\n",
       "      <td>数据分析类|大数据开发类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>1573938917198135296</td>\n",
       "      <td>李女士</td>\n",
       "      <td>女</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>Hadoop大数据开发工程师</td>\n",
       "      <td>10000</td>\n",
       "      <td>15000</td>\n",
       "      <td>2022-09-27</td>\n",
       "      <td>12500.0</td>\n",
       "      <td>广东省</td>\n",
       "      <td>广州市</td>\n",
       "      <td>番禺区</td>\n",
       "      <td>大数据开发类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>1569987734318219264</td>\n",
       "      <td>马先生</td>\n",
       "      <td>男</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>1</td>\n",
       "      <td>数据分析师|数据挖掘工程师|图像处理工程师</td>\n",
       "      <td>8000</td>\n",
       "      <td>12000</td>\n",
       "      <td>2022-09-14</td>\n",
       "      <td>10000.0</td>\n",
       "      <td>广东省</td>\n",
       "      <td>广州市</td>\n",
       "      <td>天河区</td>\n",
       "      <td>数据分析类|人工智能类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>1569514123790778368</td>\n",
       "      <td>杨先生</td>\n",
       "      <td>男</td>\n",
       "      <td>无明确就业状态</td>\n",
       "      <td>0</td>\n",
       "      <td>数据分析师</td>\n",
       "      <td>7000</td>\n",
       "      <td>10000</td>\n",
       "      <td>2022-09-13</td>\n",
       "      <td>8500.0</td>\n",
       "      <td>湖北省</td>\n",
       "      <td>武汉市</td>\n",
       "      <td>洪山区</td>\n",
       "      <td>数据分析类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>1562334736783900672</td>\n",
       "      <td>黄先生</td>\n",
       "      <td>男</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "      <td>4000</td>\n",
       "      <td>8000</td>\n",
       "      <td>2022-08-24</td>\n",
       "      <td>6000.0</td>\n",
       "      <td>广东省</td>\n",
       "      <td>广州市</td>\n",
       "      <td>天河区</td>\n",
       "      <td>数据分析类|人工智能类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>...</th>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "      <td>...</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8276</th>\n",
       "      <td>7539911466257411604</td>\n",
       "      <td>林女士</td>\n",
       "      <td>女</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "      <td>4000</td>\n",
       "      <td>6000</td>\n",
       "      <td>NaN</td>\n",
       "      <td>5000.0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>数据分析类|人工智能类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8277</th>\n",
       "      <td>7539911474847346196</td>\n",
       "      <td>易女士</td>\n",
       "      <td>女</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "      <td>4000</td>\n",
       "      <td>6000</td>\n",
       "      <td>NaN</td>\n",
       "      <td>5000.0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>数据分析类|人工智能类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8278</th>\n",
       "      <td>7539911483437280788</td>\n",
       "      <td>林女士</td>\n",
       "      <td>女</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "      <td>4000</td>\n",
       "      <td>6000</td>\n",
       "      <td>NaN</td>\n",
       "      <td>5000.0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>数据分析类|人工智能类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8279</th>\n",
       "      <td>7539911492027215380</td>\n",
       "      <td>李女士</td>\n",
       "      <td>女</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "      <td>4000</td>\n",
       "      <td>6000</td>\n",
       "      <td>NaN</td>\n",
       "      <td>5000.0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>数据分析类|人工智能类</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8280</th>\n",
       "      <td>7539911500617149972</td>\n",
       "      <td>范先生</td>\n",
       "      <td>男</td>\n",
       "      <td>毕业找工作</td>\n",
       "      <td>0</td>\n",
       "      <td>数据分析师|数据挖掘工程师</td>\n",
       "      <td>4000</td>\n",
       "      <td>6000</td>\n",
       "      <td>NaN</td>\n",
       "      <td>5000.0</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>数据分析类|人工智能类</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "<p>8281 rows × 14 columns</p>\n",
       "</div>"
      ],
      "text/plain": [
       "                 resumeId username gender jobStatus  exp  \\\n",
       "0     1574625077318778880      谢女士      女     毕业找工作    0   \n",
       "1     1573938917198135296      李女士      女     毕业找工作    0   \n",
       "2     1569987734318219264      马先生      男     毕业找工作    1   \n",
       "3     1569514123790778368      杨先生      男   无明确就业状态    0   \n",
       "4     1562334736783900672      黄先生      男     毕业找工作    0   \n",
       "...                   ...      ...    ...       ...  ...   \n",
       "8276  7539911466257411604      林女士      女     毕业找工作    0   \n",
       "8277  7539911474847346196      易女士      女     毕业找工作    0   \n",
       "8278  7539911483437280788      林女士      女     毕业找工作    0   \n",
       "8279  7539911492027215380      李女士      女     毕业找工作    0   \n",
       "8280  7539911500617149972      范先生      男     毕业找工作    0   \n",
       "\n",
       "             expectPosition  willSalaryStart  willSalaryEnd  updateTime  \\\n",
       "0      Hadoop大数据开发工程师|数据分析师             9000          11000  2022-09-27   \n",
       "1            Hadoop大数据开发工程师            10000          15000  2022-09-27   \n",
       "2     数据分析师|数据挖掘工程师|图像处理工程师             8000          12000  2022-09-14   \n",
       "3                     数据分析师             7000          10000  2022-09-13   \n",
       "4             数据分析师|数据挖掘工程师             4000           8000  2022-08-24   \n",
       "...                     ...              ...            ...         ...   \n",
       "8276          数据分析师|数据挖掘工程师             4000           6000         NaN   \n",
       "8277          数据分析师|数据挖掘工程师             4000           6000         NaN   \n",
       "8278          数据分析师|数据挖掘工程师             4000           6000         NaN   \n",
       "8279          数据分析师|数据挖掘工程师             4000           6000         NaN   \n",
       "8280          数据分析师|数据挖掘工程师             4000           6000         NaN   \n",
       "\n",
       "      averageSalary province city region expectPosition2  \n",
       "0           10000.0      广东省  深圳市    南山区    数据分析类|大数据开发类  \n",
       "1           12500.0      广东省  广州市    番禺区          大数据开发类  \n",
       "2           10000.0      广东省  广州市    天河区     数据分析类|人工智能类  \n",
       "3            8500.0      湖北省  武汉市    洪山区           数据分析类  \n",
       "4            6000.0      广东省  广州市    天河区     数据分析类|人工智能类  \n",
       "...             ...      ...  ...    ...             ...  \n",
       "8276         5000.0      NaN  NaN    NaN     数据分析类|人工智能类  \n",
       "8277         5000.0      NaN  NaN    NaN     数据分析类|人工智能类  \n",
       "8278         5000.0      NaN  NaN    NaN     数据分析类|人工智能类  \n",
       "8279         5000.0      NaN  NaN    NaN     数据分析类|人工智能类  \n",
       "8280         5000.0      NaN  NaN    NaN     数据分析类|人工智能类  \n",
       "\n",
       "[8281 rows x 14 columns]"
      ]
     },
     "execution_count": 9,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "People"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [],
   "source": [
    "Job.to_csv(\"../Data/ProcessData/Job.csv\",index=None,encoding=\"utf-8\")\n",
    "People.to_csv(\"../Data/ProcessData/People.csv\",index=None,encoding=\"utf-8\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.9.1"
  },
  "orig_nbformat": 4
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
